AI 專案不只是訓練模型,更是一條完整的旅程。從 資料準備 → 模型訓練 → 驗證 → 部署 → 監控,每個環節都決定了最終的成敗。
今天,我們來看 Azure AI Foundry 與 GCP Vertex AI 如何幫助我們走完整條路。
1️⃣ AI 開發流程五大步驟
資料準備 (Data Preparation)
收集、清理、標註資料
影響模型效能的基礎
模型訓練 (Model Training)
選擇演算法 / 模型架構
使用 GPU/TPU 等加速器進行訓練
驗證與調優 (Evaluation & Tuning)
衡量模型準確率、召回率
超參數調整、避免過擬合
部署 (Deployment)
讓模型能被應用程式或服務呼叫
支援 API、批次推論
監控與維護 (Monitoring & Maintenance)
監控效能與偏差
持續收集新資料進行再訓練
2️⃣ Azure AI Foundry 的開發流程
資料準備
Azure Machine Learning Data Labeling
Azure Data Factory(資料整合)
訓練
Azure Machine Learning (AML) 提供 Notebook、Pipeline
支援分散式 GPU 訓練
調優
AutoML 自動挑選最佳模型
HyperDrive 進行超參數最佳化
部署
部署到 Azure Kubernetes Service (AKS)
或直接包成 API(即時推論 / 批次推論)
監控
Application Insights
MLflow tracking 支援實驗紀錄
3️⃣ GCP Vertex AI 的開發流程
資料準備
BigQuery(結構化數據處理)
Dataflow / Dataprep(ETL 與資料清理)
訓練
Vertex AI Workbench (JupyterLab)
支援 TPU、GPU 加速
調優
AutoML(低程式碼方式自動建模)
Hyperparameter Tuning API
部署
Vertex AI Endpoints(即時預測)
Batch Prediction(批次推論)
監控
Model Monitoring(檢測輸入資料漂移)
Explainable AI(解釋模型決策依據)
4️⃣ 對照表
開發階段 Azure AI Foundry GCP Vertex AI
資料準備 Data Factory、Data Labeling BigQuery、Dataflow、Dataprep
模型訓練 AML Notebook、Pipeline、GPU/AKS Vertex Workbench、TPU/GPU
調優 AutoML、HyperDrive AutoML、Hyperparameter Tuning
部署 AKS、即時推論 API、批次推論 Endpoints、Batch Prediction
監控 MLflow、Application Insights Model Monitoring、Explainable AI
5️⃣ 小結
今天我們學到:
AI 開發是一個 完整週期,不是單純丟資料訓練模型
Azure 與 GCP 在流程上相似,但各自有 強項:
Azure 偏向企業導向,強調與 DevOps / MLOps 整合
GCP 偏向數據科學,強調大數據與 TPUs 優勢
如果團隊已有既有的數據系統(如 BigQuery / Azure SQL),選擇同生態系會更有效率